全球强化学习+VLA范式,PI*0.6背后都有这家中国公司技术伏笔 全球强化学习+VLA范式,PI*0.6背后都有这家中国公司技术伏笔 关键词: 模型训练,PI*0.6,π0.6,VLA+online RL 在 Physical Intelligence 最新的成果 π0.6 论文里,他们介绍了 π0.6 迭代式强化学习的思路来源: 来自主题: AI技术研报 8244 点击 2025-12-15 09:58